基于GPU的LOF算法加速

基于GPU的LOF算法加速

作者:师大云端图书馆 时间:2022-08-28 分类:参考文献 喜欢:2585
师大云端图书馆

【摘要】异常检测是指发现系统或用户偏离常规的行为,在信用卡欺诈、网络入侵、系统故障检测等方面有着广泛的应用。异常检测通常将正常的行为特征存储在数据库中,然后将当前行为特征与数据库中的行为特征进行比较,当两者偏差足够大时判断发生了异常。用于异常检测的方法很多,LOF(LocalOutlierFactor)算法通过计算测试实例的LOF值来判断其是否异常,由于检测率高而得到广泛的应用。然而,LOF算法的计算复杂度很高,其中时间开销最大的操作是kNN计算。在数据规模很大时,LOF算法的时间开销限制了它在低延迟应用中的使用。虽然有很多工作对LOF算法以及kNN算法进行了多种方式的优化,但这些优化方法在数据规模很大或数据维度很高时都存在复杂度太高的问题。近年来,GPU已经发展为包含成百上千个计算单元、具有强大计算能力的众核处理器。GPU统一架构及CUDA(ComputeUnifiedDeviceArchitecture)的出现极大地方便了GPU的编程工作,使得GPU的应用领域从最初的图形图像渲染很快扩展到通用计算领域。目前已有一些工作使用GPU来加速异常检测领域的算法,其中就有针对LOF算法以及kNN算法的并行化工作。但这些工作都没有充分利用GPU的体系结构特点,LOF算法和kNN算法在GPU上还有很大的优化空间。本文研究基于GPU的LOF算法高效实现,重点研究时间开销最大的kNN算法的高效实现。本文将kNN计算分为距离计算和k-近邻查找两个步骤,分别进行优化。对于距离计算,本文重新定义了数据实例的数据结构以及存储方式,并充分利用全局存储器的合并访问特性来提高访存效率。对于k-近邻查找,本文通过距离过滤减少需要参与排序的距离值,减少了线程串行化排序的执行时间。基于高效的kNN实现,本文在CPU-GPU平台上实现了LOF算法的并行加速。本文在真实的数据集上对基于GPU的kNN算法实现及LOF算法实现进行了实验评估,并与其它同类实现进行了比较。实验表明本文实现比已有同类实现有显著的性能提升。
【作者】田盼;
【导师】华蓓;
【作者基本信息】中国科学技术大学,计算机系统结构,2014,硕士
【关键词】异常检测;LOF算法;kNN算法;GPU;并行优化;

【参考文献】
[1]田薇.陈元靓的《事林广记》及其史料中的教育思想初探[D].内蒙古师范大学,中国古典文献学,2012,硕士.
[2]吴雪梅.贵金属纳米颗粒的表面性质对葡萄糖氧化酶活性的影响[D].华东师范大学,物理化学,2013,硕士.
[3]杨俊荣.朴赞郁电影艺术风格研究[D].河北大学,戏剧与影视学,2014,硕士.
[4]蔡方洁.物流企业并购价值评估研究[D].北京交通大学,2014.
[5]严文康.铝裂纹扩展行为的分子动力学模拟[D].南昌航空大学,机械工程(专业学位),2013,硕士.
[6]李小波.金融服务业中层管理者职涯资本对职业成功的影响机制研究[D].西南财经大学,人力资源管理,2014,博士.
[7]周明畅.九一八事变后的报界舆论及其政治诉求[D].华中师范大学,中国近现代史,2014,硕士.
[8]曹小丽.光伏并网软件锁相技术的研究[D].南昌航空大学,通信与信息系统,2013,硕士.
[9]王向东.“最近发展区”理论指导下的中学历史教学研究[D].华中师范大学,学科教学,2013,硕士.
[10]周涛.金融企业生存的“命脉”——构筑灾难备份系统延续企业生命[J].中国计算机用户.2003(11)
[11]赵念.现代性视野下的民国期刊《红杂志》研究[D].安徽大学,中国现当代文学,2014,硕士.
[12]方蕾蕾.汉语电视教学节目分析[D].吉林大学,汉语国际教育,2013,硕士.
[13]姜薇.太平洋牡蛎类FUT2基因的克隆与时空表达[D].中国海洋大学,食品科学,2014,硕士.
[14]王辉.贝多芬小提琴奏鸣曲的创作风格及演奏实践探寻[D].西安音乐学院,小提琴演奏,2014,硕士.
[15]范右飞.伐地那非通过改善氧化应激水平治疗肺动脉高压的临床与基础研究[D].山东大学,儿科学,2014,博士.
[16]薛凯宏.冀东南上古生界煤系沉积相特征及聚煤规律[D].中国矿业大学,矿产普查与勘探,2014,硕士.
[17]窦玉坛,史松群,刘化清.基于FOA的叠前反演方法[J].石油地球物理勘探,2013,06:948-953+1016+851.
[18]姚雯,邱岭.1000MW机组厂用电系统电压及接线选择[J].电力系统自动化,2006,23:101-103.
[19]吴颖奕.辽宁省欣欣采石场破损山体地质灾害防治研究[D].吉林大学,地质工程,2014,硕士.
[20]唐知华.跨站点脚本攻击的检测技术研究[D].杭州电子科技大学,计算机软件与理论,2011,硕士.
[21]金丽丽.中国工业品进出口贸易的完全就业效应分析[D].南京财经大学,劳动经济学,2012,硕士.
[22]田泉,王静,刘英丽,孙宝国.食品及包装材料中双酚A的检测方法[J].中国食品学报,2013,03:156-162.
[23]张习军.无刷直流电动机模糊神经网络控制算法的研究[D].山东大学,电子与通信工程(专业学位),2013,硕士.
[24]邓海文,艾虹虹,李斌.基于Bays网络数据挖掘的入侵检测模型的探讨[J].科技广场,2005,06:30-33.
[25]李妍妍.木质陶瓷基凹凸棒石/针铁矿复合材料制备与性能表征研究[D].合肥工业大学,环境工程,2014,硕士.
[26]吴志佩.基于多种吊桥同步装卸的集装箱码头集成调度方法[D].宁波大学,机械工程,2013,硕士.
[27]黄小华,孙永,沈能,唐华东,任红,彭明利.双亲姜黄素衍生物减轻大鼠肝纤维化与抗炎抗氧化作用的研究[J].中国药理学通报,2015,04:470-475.
[28]张姣.汉语词汇化对英语词汇推理加工过程影响的实验研究[D].宁波大学,外国语言学及应用语言学,2014,硕士.
[29]王艳静.氧化铈/石墨烯复合材料的制备及光催化性能的研究[D].北京邮电大学,2014.
[30]陈万里.基于商空间理论和粗糙集理论的粒计算模型研究[D].安徽大学,2005.
[31]周洽.车用大功率液力减速器电液比例充放液控制技术研究[D].北京理工大学,车辆工程,2014,硕士.
[32]马晶.面向P2P网络的分布式Web Crawler的研究[D].东北大学,计算机应用技术,2010,硕士.
[33]史兴键,李伟华,王文奇.基于优化聚类算法的安全审计模型[J].计算机工程与应用,2005,17:1-2+29.
[34]武琳.超声导波在钢轨中传播特性的仿真方法研究[D].北京交通大学,2013.
[35]王明晖.基于统计过程控制和图的序列的社会网络分析及异常诊断[D].西安电子科技大学,计算机应用技术,2011,硕士.
[36]王一闻.狨猴运动行为的发育研究[D].上海交通大学,兽医,2013,硕士.
[37]白欢欢.水力风机的数值模拟和设计研究[D].浙江大学,2014.
[38]陆文骏.有源大电容器标准的理论与制作[J].宇航计测技术.1989(01)
[39]陈峣.薄荷醇羰基酸酯的合成工艺及其在药物合成中的应用研究[D].华东理工大学,有机化学,2013,硕士.
[40]彭雄斌,龚国芳,陈馈,王林涛.管片拼装机提升缸模糊PID同步控制[J].浙江大学学报(工学版),2014,11:2002-2008.
[41]张文敬.动态最优路径机制在网络存储中的应用[D].西安建筑科技大学,控制理论与控制工程,2013,硕士.
[42]杨昊宇.羽扇豆醇及新型桦木醇衍生物的合成和活性筛选[D].湖南大学,药物化学,2011,硕士.
[43]尹海丹.向“中间王国”的探索—试论当代女性主义科学论的本体论转向[D].南京大学,科学技术哲学,2013,硕士.
[44]姜川.天津市城乡居民基本医疗保险存在问题与对策研究[D].中国地质大学(北京),公共管理,2013,硕士.
[45]刘雪松.RAFT乳液聚合制备纳米胶囊[D].浙江大学,化学工程,2013,硕士.
[46]金泉.日语长句子的句法分析[D].大连理工大学,计算机应用技术,2004,硕士.
[47]潘卓洪,梅桂华,张露,谭波,文习山.抑制变压器直流偏磁的电流注入法[J].电力系统自动化,2009,20:88-91+108.
[48]王英超.广义系统正实控制与耗散控制问题的研究[D].辽宁大学,应用数学,2012,硕士.
[49]虢晓芳.中国红河—越南老街跨境经济合作区的研究[D].云南财经大学,世界经济,2013,硕士.
[50]常晨辉.基于表面等离子体激元的微纳光子器件性能分析[D].南京邮电大学,光学工程,2013,硕士.

相关推荐
更多